关于导出 Word 的机制

本贴最后更新于 1269 天前,其中的信息可能已经水流花落

@88250 D 大,请教一下,思源导出 Word 的机制是这样的命令吗?

pandoc Z:\xxxx.sy -o output.docx

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    25629 引用 • 106008 回帖
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    9813 引用 • 44596 回帖 • 82 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 思源用的是 Pandoc,但是不是直接转换,而是先将文档转换为 HTML,然后再通过 Pandoc 将 HTML 转换为 Docx。

    1 回复
  • Diamond 2

    Pandoc 转的时候能加参数吗?或者考虑后期支持添加参数的功能吗?我现在整体上实现了 思源笔记内容 +zotero(文献管理软件)+Word 的论文写作工作流,但是手动操作的话,稍微复杂,需要支持这种命令(中间有几个参数):

    pandoc Z:\xxxx.sy -s --lua-filter=zotero.lua -o output.docx

    如果可以打通的话,可能能吸引一批搞科研的

    目前设想是,在思源文档开头的一个区域,用特征符号隔离一个命令(三个减号)或者把命令存在文档标题的某个属性值,不知道是否考虑?如果考虑的话,我抽时间搞个简单的教程

    3 回复
  • 通过设置特定属性应该是个不错的方案,Issue #3535 · siyuan-note/siyuan

    在文档上设置属性 pandoc-docx,值为附加参数列表,比如 --reference-doc twocolumns.docx --lua-filter=zotero.lua

    你看这样如何,我们打算在下个内测版中引入,欢迎加入内测帮忙测试,谢谢。

    2 回复
  • Diamond

    可以可以 ,我 github,打酱油的 https://github.com/wazili

    1 回复
  • 已经邀请,预计明天会发布 v1.5.5-alpha1 内测版。

    2 回复
  • Diamond 1

    ok,期待,不过最近可能有点忙,尽量及时反馈

  • maojiajing

    思源 +zotero+word 工作流 期待教程

  • 同期待教程

  • maojiajing

    D 大,能否具体指导一下怎么操作呢

  • Diamond

    内测版我试了一下,没实现,总结如下

    前提准备:
    下载 https://www.lanzouw.com/iC7Bqx5vzgf
    下载并安装 Zotero | Your personal research assistant@HTTP
    然后安装插件 Release v5.6.11 · retorquere/zotero-better-bibtex@HTTP 到 zotero
    zotero 导入 zotero 导出的条目.rdf

    笔记内容是 20211202193901-w7yhtbe.sy

    思源笔记先导出 markdown,然后 zotero 处于打开状态,cmd 命令行执行 pandoc Z:\Downloads\Untitled\Untitled.md -s --lua-filter Z:\zotero.lua -o output.docx 可以成功转化(转换过程中需要和 zotero 通讯),

    但是在思源笔记 v1.5.5 alpha 版中,设置属性 pandoc-docx ,属性值 -s --lua-filter Z:\zotero.lua ,导出的 Word 和不加参数导出的一样,即属性值没有起到作用

    我的问题是:

    1. 为了达到能转换成功的目的,cmd 应该怎样正确填写到思源笔记的属性中?
    2. 或者说,思源笔记现在的导出流程(思源笔记 → HTML →Pandoc 转为 docx)不能使得 zotero.lua 参数产生作用,手动导出流程 B(思源笔记 → markdown →Pandoc 转为 docx)可以使得 zotero.lua 参数产生作用,难道中间必须使用 markdown 格式做跳板?如果是后者的话,那么目前 pandoc-docx 属性并不能使得思源笔记和参考文献管理软件 zotero 产生联动
    1 回复
  • 目前思源导出 Word 的流程:

    .sy -> Markdown -> HTML -> Pandoc Word

    导出 pandoc-docx 属性只在调用 HTML -> Pandoc Word 这一步会作为 pandoc 命令参数加入。

    1 回复
  • Diamond

    那我理解了, --lua-filter=zotero.lua 这个参数目前应该是无法作用于 SY 导出流程的

    我不知道别人转换的时候,pandoc-docx 这个参数是否起作用?

    SY 是否考虑更改或者添加一个导出流程(sy. → markdown → Pandoc 转为 Word)?

    原因是,我看网上积累的很多 Pandoc 转换经验、方案都是 markdown 直接转为 Word,我使用 Pandoc 也是模仿别人的经验,包括上面联合 zotero 要用到的 zotero.lua 文件也是我从别的帖子里下载的

    谢谢

    1 回复
  • 这个暂时不会添加,因为目前已经支持导出 Markdown 了,后半部分的流程还是通过其他外部工具或者手动操作一下吧。

    1 回复
  • Diamond

    好吧,那我只能手动将就着用吧

  • Diamond

    @88250 再次请教一下,

    1. 思源目前导出为 markdown、Word、pdf、html 的机制分别对应下面这四个过程吗?

      .sy -> Markdown
      .sy -> Markdown -> HTML -> Pandoc Word
      .sy -> Markdown -> HTML -> Pandoc PDF
      .sy -> Markdown -> HTML

    2. .sy -> markdown 这个过程是内核转换的吗?还是使用的其它工具?

    3. 我在 Pandoc 社区发帖咨询了一下 Pandoc 转换 HTML 为 Word 时,--lua-filter=zotero.lua 参数是否起作用,目前在等待回复。

    谢谢

    1 回复
    1 操作
    Diamond 在 2021-12-07 23:40:47 更新了该回帖
    1. 是的
    2. 内核转的
    1 回复
  • Diamond 1

    谢谢回复

    1. 我先观望一下 Pandoc 在 html->word 过程中 是否支持 --lua-filter=zotero.lua 参数;
    2. 我今晚看 Pandoc 资料后,还是建议思源考虑加一个支持 属性参数 的转换流程: .sy -> Markdown ->Pandoc 带参数转为word,这种流程可参考的 Pandoc 教程、资源比较多,比较成熟
  • Diamond

    @88250 D 大,我昨天试了一下 v1.5.5,现在支持 .lua 参数了,但是存在一个问题,你那应该也可以直接试一下

    1. 使用文档属性参数 pandoc-docx -f markdown,导出 Word 时,代码块、图片不能导出来,有序列表没有序号,其它未测试
    2. 不使用属性参数的话,导出的 Word,有代码块、图片、有序列表的序号

    不知是否是我设置的文档属性参数有问题?可否提供一个参数?

    谢谢

    1 回复
  • 格式参数已经写死了是 docx 的,所以再指定的话会有冲突;还是等这个吧 Issue #3592 · siyuan-note/siyuan

    1 回复
  • Diamond

    噢噢噢,我昨天见你把请求增加 Markdown -> Pandoc 带参转换 · Issue #3592 · siyuan-note/siyuan closed 了,还以为这个功能在 1.5.5 已经实现了,看来还没有哦

    1 回复
  • 这个 #3592 没有关闭过,v1.5.5 关闭的是 Issue #3535 · siyuan-note/siyuan

  • Diamond

    @88250 D 大,v1.7.6 导出 Word 是怎么导的?支持属性参数吗?

    1 回复
  • 不支持。

    1 回复
  • Diamond

    好吧,谢谢

请输入回帖内容 ...

推荐标签 标签

  • 倾城之链
    23 引用 • 66 回帖 • 168 关注
  • 招聘

    哪里都缺人,哪里都不缺人。

    188 引用 • 1057 回帖
  • Flume

    Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。

    9 引用 • 6 回帖 • 657 关注
  • ZooKeeper

    ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 HBase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

    59 引用 • 29 回帖 • 2 关注
  • Pipe

    Pipe 是一款小而美的开源博客平台。Pipe 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    134 引用 • 1127 回帖 • 110 关注
  • V2EX

    V2EX 是创意工作者们的社区。这里目前汇聚了超过 400,000 名主要来自互联网行业、游戏行业和媒体行业的创意工作者。V2EX 希望能够成为创意工作者们的生活和事业的一部分。

    16 引用 • 236 回帖 • 256 关注
  • Scala

    Scala 是一门多范式的编程语言,集成面向对象编程和函数式编程的各种特性。

    13 引用 • 11 回帖 • 159 关注
  • DevOps

    DevOps(Development 和 Operations 的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。

    59 引用 • 25 回帖 • 1 关注
  • Node.js

    Node.js 是一个基于 Chrome JavaScript 运行时建立的平台, 用于方便地搭建响应速度快、易于扩展的网络应用。Node.js 使用事件驱动, 非阻塞 I/O 模型而得以轻量和高效。

    139 引用 • 269 回帖
  • 设计模式

    设计模式(Design pattern)代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开发过程中面临的一般问题的解决方案。这些解决方案是众多软件开发人员经过相当长的一段时间的试验和错误总结出来的。

    200 引用 • 120 回帖
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 85 关注
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    36 引用 • 35 回帖 • 3 关注
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    56 引用 • 85 回帖
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    83 引用 • 37 回帖
  • 一些有用的避坑指南。

    69 引用 • 93 回帖 • 1 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 487 关注
  • JavaScript

    JavaScript 一种动态类型、弱类型、基于原型的直译式脚本语言,内置支持类型。它的解释器被称为 JavaScript 引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在 HTML 网页上使用,用来给 HTML 网页增加动态功能。

    734 引用 • 1281 回帖
  • Rust

    Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。

    58 引用 • 22 回帖 • 8 关注
  • Outlook
    1 引用 • 5 回帖 • 3 关注
  • 人工智能

    人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

    173 引用 • 315 回帖
  • AWS
    11 引用 • 28 回帖 • 4 关注
  • 酷鸟浏览器

    安全 · 稳定 · 快速
    为跨境从业人员提供专业的跨境浏览器

    3 引用 • 59 回帖 • 46 关注
  • danl
    168 关注
  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    54 引用 • 37 回帖
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 554 关注
  • 钉钉

    钉钉,专为中国企业打造的免费沟通协同多端平台, 阿里巴巴出品。

    15 引用 • 67 回帖 • 274 关注
  • OpenResty

    OpenResty 是一个基于 NGINX 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。

    17 引用 • 52 关注